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Laburpena: Gutxi dira sare sozialetan oinarrituz euskara landu duten ikerketa-lanak, 
eta are gutxiago Euskal Herrian ospatutako ekitaldiek sare sozialetan utzitako aztarnak az- 
tertu dituztenak. Hutsune hori hete eta arlo honetan ikerketa sustatzeko asmoz, lan aitzin- 
daria aurkeztea du helhuru artikulu honek. Horretarako, “Euskahaldun” lemapean 2015eko 
Korrika martxak Twitter sare sozialean sortutako jarduna hatzeko jarraitutako metodolo- 
gia azaldu eta emaitza aztertzen dugu artikulu honetan. Gure analisiak erakusten duenez, 
emozio handieneko momentuak Twitterren ere islatzen dira, txio kopuru handiagoa sor- 
tuz. Horrez gain, euskal komunitatean ikusgarritasuna lortu eta informazioa lau haizetara 
zahaltzeko ekitaldiarekin lotutako kontu ofiziala izatearen garrantzia erakusten dugu, eta 
haita kazetari eta komunikabideen parte-hartzearen beharra ere. Guztion eskura jarri ditu- 
gu Twitterrekin antzeko analisiak egiteko tresnak, antzeko ikerketa lanak sustatu asmoz. 

Hitz-gakoak: sare sozialak, ekitaldiak, Twitter, jarrera, datu meatzaritza 

Abstract: This work is motivated by the dearth of research that deals with 
social media content created from the Basque Country or written in Basque 
language. While social fingerprints during events have been analysed in nu- 
merous other locations and languages, this article aims to fill this gap so as to 
initiate a much-needed research area within the Basque scientific community. 
To this end, we describe the methodology we followed to collect tweets posted 
during the quintessential exhibition race in support of the Basque language, 
Korrika. We also present the results of the analysis of these tweets. Our anal- 
ysis shows that the most eventful moments lead to spikes in tweeting activity, 
producing more tweets. Furthermore, we emphasise the importance of having 
an official account for the event in question, which helps improve the visibility 
of the event in the social network as well as the dissemination of information to 
the Basque community. Along with the ofRcial account, journalists and news 
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organisations play a crncial role in the difFusion of information. In order to en- 
courage others to perform further research in the field, we make all the tools 
publicly available. 

Keywords: social media, events, Twitter, behaviour, data mining 


1. Sarrera 

Interneten garapenarekin batera tresna berriak garatu eta argitaratu dira, Web 2.0 fe- 
nomenoaren garrantzia areagotuz. Izan ere, Web 2.0 delakoan erabiltzaileek, Internetetik 
informazioa jasotzeaz gain, modu errazean egin dezakete ekarpena eta sareko informazio- 
jarioa eta ezagutza aberastu. Web 2.0 tresnen artean, sare sozialak dira nabarmendu dai- 
tezkeen tresna horietako bat. Sare sozialetan erabiltzaileek parte hartu eta ekarpenak egi- 
teaz gain, lagun-sare bat sortzeko aukera dute, eta ondorioz, aukeratutako lagun-sarearekin 
informazioa, argazkiak eta bideoak konpartitu, eztabaidatu eta solasteko aukera eskaintzen 
diete. 

Gaur egungo sare sozial nagusien artean, Twitter^ dugu ikerketarako erabiliena. Izan 
ere, sare sozial honetan erabiltzaileek idazten dituzten mezuak eskuratzeko aukera es- 
kaintzen zaigu, eta horrek aukera paregabea eskaintzen du tresna informatikoen bidez 
datu-bildumak batu eta ikertu ahal izateko. Beste sare sozial batzuetan ez bezala, Twit- 
terren gehienez 140 karaktereko mezuak bidaltzera mugatuta daude erabiltzaileak. Mezu 
labur hauek txio izena dute, eta interesgarri iruditzen zaion orok zabaldu egin dezake; bes- 
te norbaiten txioa zabaltze horri bertxio deritzo. Erabilgarritasunaren aldetik abantaila 
paregabeak eskaintzen ditu horrek. Besteak beste, oso erraza da edonondik sakeleko tele- 
fonoa erabiliz zure begien aurrean ikusten ari zarenaren gainean txiokatzea. Horrek, esate 
baterako, herri kazetaritzaren hazkundea ahalbidetu du, edonork informa baitezake edo- 
nondik, eta Twitter bezalako sare handi batean ikusgarritasuna lortu. Era berean, ekitaldi 
bat ospatzen ari den bitartean, erabiltzaileek iritziak, argazkiak, bideoak, eta albisteak 
zabal ditzakete. 

Twitterrek datuok biltzeko eskaintzen dizkigun aukerei esker, interes handia piztu da 
komunitate zientifikoan, ikerketa egiteko informazio iturri aberatsa baita. Ondorioz, asko 
dira Twitterren ekitaldi ezberdinek utzitako islaren ikerketa egin duten lanak, tartean New 
Yorkeko Occupy Wall Street [1, 2], Arabiar Udaberria [3] edo Munduko Futbol Txapel- 
keta [4, 5] bezalakoak analizatuz. Baina ekitaldi horiek guztiak erdaraz eta nazioartean 
gertatutakoak dira, eta orain arte ez da antzeko lanik egin euskaraz zein Euskal Herrian 
gertatutako ekitaldiekin. 

Euskal komunitate zientifikoa arlo honetan lan gehiago burutu eta Euskal Herriko 
^http://twitter.com/ 
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ekitaldiak aztertzera animatu nahian, lan aitzindaria aurkezten dugu artikulu honetan. 
Hemen aurkezten den lana IkerGazte kongresuan^ emandako “Sare sozialetatik erauzita- 
ko datuetan oinarritutako ikerketa” tailerraren prestaketaren emaitza da. Twitter iturri 
bezala hartuta, ikertzea helburu izanez datuak biltzeko metodologia azaltzen dugu, ho- 
rretarako behar diren tresnak guztion eskura jarriz. Euskararen kasua aztertzeko aukera 
ezinhobea eskaintzen duen ekitaldi baten adibidea aurkezten dugu artikuluan, Korrikare- 
na^ hain zuzen ere, analisia egin eta emaitzak azalduz. 

Metodologia hau definituz eta kodea guztion eskura jarriz euskal komunitate zienti- 
fikoak arlo honetan ikertzen jarraitzea dugu helburu nagusi lan honekin, euskarazko eta 
Euskal Herriko ekitaldiek sare sozialetan sortzen duten isla aztertuz euskal komunitatearen 
jarrera hobeto ulertzeko. 

2. Twitterren gaineko ikerketa 

Twitter sare sozial nagusienetakoa bilakatu da gaur egun. Twitterrek berak ematen 
dituen estatistiken arabera^, 300 milioi erabiltzailetik gora dira hilero ekarpenen bat egi- 
ten dutenak, eta egunero 500 milioi txioren inguruan jasotzen ditu sare sozialak. Zai- 
la da zehatz-mehatz txio hauen guztien artean euskarazkoak zenbat diren jakitea, bai- 
na Umap-ek^, euskarazko jarduna hein handi batean batzen duen tresnak, ematen ditu 
gutxi gorabeherako datu batzuk. Horien arabera®, 7.000 erabiltzaile baino gehiago dira 
nagusiki euskaraz txiokatzen aritzen direnak, eta 2015eko apirilean 226.000 txio inguru 
ziren euskarazkoak, egunean 7.539 batez beste. Horrenbesteko datu-jario etengabea duen 
informazio-iturriak ikerketarako bilduma paregabea eskaintzen du ondorioz, eta asko dira 
horri etekina ateratzen ari direnak. 

Azken urteotan, Twitter sare sozialean elkarbanatutako txioen gainean egindako iker- 
keta lanak nabarmen hazten ari dira. Sare soziala 2006ko martxoan^ abiatu bazen ere, 
2010. urtean argitaratu ziren lehen ikerketa-lanak [6]. Orduz geroztik, etengabe hazten 
doa Twitter sare sozialean oinarritzen diren ikerketa-lanen kopurua. Izan ere, Twitter sare 
sozialak datuak eskuratu ahal izateko aukera paregabeak eskaintzen dizkigu ikertzaileoi, 
doan eta nahiko erraz lor baitaitezke datu bilduma handiak. Twitterrek hiru abantaila 
nagusi eskaintzen dizkigu ikerketa dugunean helburu: 

• Datu-bilduma handiak lortzeko erraztasuna: Twitter APIa baliatuz datuak 
eskuratzea doakoa da, eta muga batzuk dituen arren (esate baterako, eskaera kopu- 
rua mugatua du, eta ez du datu-base osoaren %1 baino gehiago eskuratzen uzten), 

^ http://www.ueu.eus/ikergazte/ 

®http://www.korrika.eus/ 

^https: / / about.twitter.com/company 
®http: / / umap.eu/ 

® http://umap.eu/media/pdf/umap_2015_4.pdf 
^https: / / about.twitter.com/milestones 
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datu-bilduma handiak lortzeko aukera eskaintzen du, eta normalean muga horiek ez 
dira oztopo izaten, datu-bilduma erraldoiak nahi baldin ez badira behintzat. 

• Datuen naturaltasuna: beste ikerketa-metodo tradizional batzuekin alderatuta, 
Twitterretik jasotako datuak naturalagoak dira. Metodo tradizionalean parte-hartzaileak 
batu ohi dira, eta ikerketaren helburua azaldu ondoren, haien erantzunak zein beste- 
lako datuak gordetzen dira. Horrelako kasuetan gerta litekeena da parte-hartzaileek 
emandako erantzunak guztiz egiazkoak ez izatea, eta, ondorioz, ikerketaren emai- 
tza nolabait izorratzea. Twitter bezalako sistemen abantaila da erabiltzaileek modu 
naturalean idazten dutela, nahi dutelako, eta inork behartu gabe. 

• Mota ezberdinetako datuak lor daitezke: Askotan Twitter lagunarteko elkarriz- 
ketetarako eta “orain zer egiten ari naizen” bezalakoak zabaltzeko baino erabiltzen 
ez dela uste den arren, beste mota askotako informazioa topa daiteke bertan. Era- 
biltzaile askok eta askok inguruko ekitaldiez hitz egin ohi dute, eta batzuetan, azken 
orduko albisteak gertatu ahala, bertan dauden lekukoek informazio esklusiboa ere 
eman izan dute, tresnaren ezaugarriei esker. 

Goiko abantailei erreparatuz ikerketarako informazio-iturri perfektua dirudien arren, 
baditu kontuan izan beharreko hainbat desabantaila ere: 

• Datuak eskuratzen azkar ibili beharra: Twitter APIa doakoa den arren, muga 
nagusienetakoa da datu historikoak eskuratzeko zailtasuna. Twitterren APIa bereziki 
prestatuta dago denbora errealean konpartitzen diren txioak, zein azken astean bidali 
diren txioak eskuratzeko, eta txio zaharragoak eskuratu nahi ditugunean arazoak 
izan ditzakegu askotan. Txioek Twitterren datu-basean jarraitzen duten arren, ez 
daude modu errazean eskuragarri. Horrelakoetan, ordainpeko zerbitzuetara jotzea 
gomendatzen da; baina hori oztopo handia izan daiteke askotan ikertzaileontzako. 
Ondorioz, adi egotea eta txioak denbora errealean edo berehala, ordu gutxi batzuen 
buruan, eskuratzea da egokiena. 

• Hizkuntza informala: Twitterren konpartitzen den edukia aztertzean ez dute ohi- 
ko analisi linguistikorako tresnek ondo funtzionatzen. Arazo nagusia da sare soziale- 
tan hizkuntza informala erabili ohi dela, eta, beraz, akats ortografikoez eta laburdu- 
rez josita egon ohi dela. Hori dela eta, zailagoa da edukia aztertzea, azken urteotan 
alor horretako ikerketa hobetzen ari den arren. 

• Geznrrak: Albisteak jarraitzean, esate baterako, kontu handiz hartu behar izaten da 
Twitterren irakurritakoa, oso erraza baita albisteak asmatu eta gezurrezko istorioak 
sarean jartzea. Horrek ikerketan ere eragina izan dezake [7], eta, beraz, kontuz ibili 
behar da sare sozialetako edukiak aztertzean. 
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• Datu demografikoen gabezia: Twitterreko erabiltzaileak aztertzean, litekeena da 
beraien datu demografikoak erabili nahi izatea batzuetan, lagina hobeto aukeratzeko 
edo laginaren ezaugarri demografikoak jakiteko. Zoritxarrez, baina, Twitterreko era- 
biltzaileek ez dute datu demografikorik argitaratzen beren profilean, eta ezinezkoa 
da erabiltzaile baten adina, sexua, eta abar jakitea. Kokapena jakin ahal izaten da 
batzuetan, baina kokapenari dagokion eremuan erabiltzaileak edozer jar dezakeenez, 
ez da oso fidagarria. 

• Demografikoki adierazgarri ez izatea: Twitterren dauden erabiltzaileek ez dute 
gizartearen banaketa demografikoa guztiz islatzen. Sloan et al.-ek [8] erakutsi zute- 
nez, Twitterren dauden erabiltzaileak gazteak dira batez ere, eta haien profilak ez 
du gizartearekin guztiz bat egin. 

Desabantaila horiek guztiak kontuan izan beharrekoak dira, batez ere Twitterretik 
datuak biltzeko lagina ondo aukeratuz, datuen bilketan alborapenik egon ez dadin. Ho- 
rrez gain, euskararekin lan egitean aipatu beharreko beste desabantaila bat da Twitterrek 
eskaintzen duen hizkuntza iragazkia; izan ere, posible da txioak batzerakoan zein hizkun- 
tzakoak jaso nahi diren zehaztea. Zoritxarrez, ordea, Twitterrek gaur egun ez du euskara 
antzemateko gaitasunik, eta, beraz, ezin zaio esan euskarazko txioak bakarrik jaso nahi 
ditugula. Oztopo horiek alde batera utzi eta ahal den neurrian saihestuta, eta abantailei 
erreparatuz, ordea, euskaraz sare sozialen gainean dagoen ikerketa areagotu egin behar 
dela uste dugu. 

Lan honetan aurkezten den analisiari dagokionez, gainera, goiko desabantaila horiek 
ez dute eragin handirik, eta etorkizunean landu beharreko erronka gisa uzten ditugu. Era 
berean, hemen aurkezten dugun hurbilketa beste hizkuntza batzuetan eta orokorrean ko- 
munitate zientifikoan onartuta dagoena da. Artikulu honetan, Korrikaren gainean zabal- 
dutako txioen gaineko analisia eginez, ez dugu gizartea islatzen duenik aldarrikatu nahi; 
beste ikuspuntu batetik, euskarazko ekitaldi batek sare sozialetan eta bereziki Twitterren 
sortzen duen isla aztertu nahi dugu, gaur egun sareko presentziak adierazten baitu, hein 
handi batean, komunitate eta ekitaldi zehatz baten ikusgarritasuna. 

Ekitaldiak Twitter iturri gisa hartuta ikertzeari dagokionez, lan gehienak ingelesez ida- 
tzi dira, eta ingelesezko txioak aztertu dituzte [1, 2, 3, 4, 5]. Beste hizkuntza batzuetan, 
gaztelaniaz [9] zein portugesez [10] esate baterako, argitaratu da ikerketa-lanen bat. Euska- 
raz, ordea, hutsunea sumatu dugu arlo honetan, eta horixe betetzea da lan honen helburu 
nagusia. Bizkarguenagak [11], esate baterako, ikuspegi soziologikotik aztertu zuen gazteek 
sare sozialetan nola sortzen duten euskal identitatea, Facebook sare soziala aztertuz. Lan 
honek, ordea, gizarte-zientzien ikuspegi horretatik analisi kualitatiboa eskaintzen du, bes- 
te ikuspegi teknikoago batetik eskain daitekeen analisi kuantitatiboari gehiegi erreparatu 
gabe. 

Euskaraz dugun hutsunea bete nahian, lan honek Twitter sare sozialean ekitaldi baten 
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gainean zabaldutako mezuak modu kuantitatiboan aztertzeko behar den metodologia de- 
finitzen du, beharrezko tresnak ikertzaileen eskura jarriz, eta 2015ean ospatutako Korrika 
ekitaldiaren gaineko analisia aurkeztuz. 

3. Datu bilketa 

Bi erronka nagusi ditu Twitter sare sozialean zabaltzen diren mezuak jarraitu eta iker- 
keta egin ahal izateko artxibatzeak: datuak batuko dituen tresna prestatzea, eta, Twitte- 
rren jarraitu nahi den hitz eta traol sorta prestatu ondoren, datu-bilketa egitea. 

3.1. Datuak biltzeko tresna 

Twitterren APIak bi zerbitzu ezberdin eskaintzen ditu: (1) REST APIa, azken egune- 
tako txioak eskuratzeko, eta (2) streaming APIa, txioak denbora errealean eskuratzeko. 
Kasu honetan bigarrena erabili dugu, streaming APIa; izan ere, hainbat egun irauten duen 
ekitaldi baten jarraipena egiteko, errazagoa izaten da aukera hau erabiltzea. 

Python programazio-lengoaia baliatu dugu datu-bilketarako. Lengoaia honek badu 
txioak batzeko pakete bat, lana asko errazten duena, tweepy® izenekoa. Twitterretik txioak 
eskuratu eta gordetzeko garatutako kodea github-en aurki daiteke®. Hori erabiltzeko, bete 
beharreko lehen pausoa Twitterren aplikazioa sortzea da, http://apps.twitter.com/ hel- 
bidean. Ondoren, Twitterrek emango dizkigun lau kodeak twitter.ini fitxategian kopiatu 
behar dira. Hori egin ondoren, tweetcollector.py programaren bitartez txioak batzen hasi 
ahal izango dugu, honako komandoa erabiliz: 

python tweetcollector.py bilketa-mota ekitaldi-izena bilaketa-katea 
Non: 


• bilketa-mota hauetako bat izan daitekeen: ’search-recent’ (azken txioak eskuratze- 
ko), ’search-popular’ (azken asteko txio garrantzitsuenak eskuratzeko) edo ’stream’ 
(txioak denbora errealean eskuratzeko). 

• ekitaldi-izena eskuratu nahi den ekitaldiaren izena izango den. Nahi den izena aukera 
daiteke hemen, eta programak izen hori duen karpeta sortuko du data karpetaren 
barruan, non txioak gordeko diren. 

• bilaketa-katea Twitterren egin nahi dugun bilaketa den, hitz gako ezberdinak hutsu- 
nez banandurik. 


®http://www. tweepy.org/ 

®https: / / github.com / azubiaga/twitter-tools/tree / master/tweet-collection 
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3.2. Datu-bilduma: Korrika 2015 


tiveetcollector.py programa baliatuz, Korrika ospatu zen 11 egunetan zehar egin ge- 
nuen datu-bilketa, hau da, 2015eko martxoaren 19tik 29ra. Bilaketa-katea Korrikarekin 
lotutako hainbat traolekin osatu genuen, tartean ^korrika, ^euskahaldun, ^korrika2015, 

7^korrikal5 eta ^^korrikazuzenean. Horrenbestez, honako komandoarekin abiarazi genuen 
programa, eta 11 egun horietan zehar martxan mantendu: 

python tweetcollector.py stream korrikalB "#korrika""#euskahaldun""#korrika2015"... 

Datu-bilketaren emaitza 38.276 txioko bilduma izan zen. Hurrengo atalean, txio-bilduma 
horren gaineko analisia aurkezten dugu. Datu-bilduma hau sarean argitaratu dugu^^. 
Datu-bilduma honekin batera jaits daitekeen korrika.json fitxategia erabiltzen dugu anali- 
sirako iturri moduan, zeinak 38.276 lerro dituen, lerro bakoitzean txio bana, JSON forma- 
tuan. JSON formatuak dituen eremuen gaineko xehetasun gehiago Twitterren webgunean 
bertan aurki daiteke^^. 

4. Analisia 

Atal honetan analisia aurkezten dugu, bi zatitan banatuta; edukiaren analisia eta era- 
biltzaileen analisia. Analisirako landu ditugun programak eskuragarri daude sarean github- 
en^^. Horiez gain, Barberak [12] garatutako beste programa batzuk ere erabili ditugu^^. 

4.1. Edukiaren analisia 

Hasteko, edukiari erreparatuz egingo dugu analisia. Korrikak hamaika egunez jardun 
zuen Euskal Herrian zehar lasterka, eta aztertu nahiko genuke sare sozialetan utzitako isla 
nola sakabanatu den denboran zehar. Zein momentutan txiokatu zuen gehien jendeak? 

Horretarako, txio kopuruaren histograma aztertuko dugu, histogram.py programa baliatuz, 
eta honako komandoaren bitartez: 

python histogram.py korrika.json korrika-histograma.dat h 

Emaitza 1. irudian ikus daiteke. Hainbat gauza erakusten ditu histograma honek. Argi 
dagoena da, gauetan, Korrikak aurrera diharduen arren, txio kopuruak izugarri egiten 
duela behera; hori dela eta, hori dela eta histogramak 11 egunei dagozkien igoera eta 
jaitsiera nabarmenak ikus daitezke. Horrez gain, lehen eta azken eguna izan ziren txio 
gehien bidalitakoak; momenturik txiokatuena hasierakoa izan zen, ordubetean 1000 txio 

https: / / github.com / azubiaga/korrikal 5 
^ ^ https: / / dev.twitter.com/overview / api/tweets 
^ ^ https: / / github.com / azubiaga / twitter-tools 
^^https: / / github.com / pablobarbera/pytwools 
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1. irudia. Txioen histograma, orduro bidalitako txio kopurua erakusten duena. 


baino gehiagorekin. Ondorengo egunetan, txio kopurua gutxika-gutxika jaitsi zela dirudi, 
Korrikaren kontaketa ez baita hain berria eta interesa nolabait jaitsi zelako seguruenik; 
eta azkenik, nabarmen egiten zuen gora berriz azkenengo egunean, Bilboko helmugara 
iristearekin batera. 

Edukiari gertuagotik erreparatuz, interes handiena piztu zuten txioak zein izan ziren 
jakin nahi dugu. Horretarako, bertxio kopurua aztertzen dugu. Zein izan ziren bertxio 
gehien jaso zituzten txioak? Horretarako, top-tweets.py programa erabiliz, txio bertxio- 
tuenen rankinga sortu dugu; 

python top-tweets.py -v retweets -f korrika.json -k 10 

Eta 1. taulan zerrendatu ditugu Korrikan zehar bertxio gehien jaso zituzten 10 txioak. 
Mota ezberdinetako txioak ikus ditzakegu zerrenda horretan, baina, batez ere, ekitaldiare- 
kin lotutako gertakizunak kontatzen dituzten txioak (adibidez, “Hasi da korrikalD!”) eta 
txio aldarrikatzaileak (adibidez, “Korrika edo Giza katea bezalako ekimenek sortzen duten 
energia kolektiboa ez al dira nahikoa froga herri honen bidea zein den ohartzeko?”) aur- 
ki ditzakegu. Euskarazko 9 txio izateaz gain, gaztelaniazko bat ere lehen 10 hauen artean 
dago; izan ere, .eus Interneteko domeinuak deskontupean eskuratzeko promozio batek ber- 
txio asko jaso zituen. Aurrez komentatu dugun bezala, momentuz, soluzio errazik gabeko 
erronka da Twitteren hizkuntza automatikoki antzeman ahal izatea. 

Edukia beste ikuspuntu batetik begiratuta, txioak nondik bidali diren jakin nahi dugu. 




Erabiltzailea 

(Bertxioak) 

Txioa 

©MeriLingl 

(214) 

Behin batean herri txiki handi bateko milaka pertsonek, zahar eta 

gaztek gau ta egun korrika egin zuten euren hizkuntzaren alde ^mikroipuina 

©euskaltegia 

(170) 

Herri bat, euskaraz bizi nahian, tinko, harro. 92 urteko emakumea, 

Arraiotz-en. ZORAGARRIA ^KorrikaZuzenean http://t.co/VsIcWoQhhM 

@fm914 

(149) 

Ederra Indar Gorrikoek #Korrika-ri egindako agurra. 

Argazki andana gure guaxapean. Esker mila! http://t.co/p03IpvLCbP 

©ZuriHesian 

(145) 

Hunkigarria da pentsatzea edozein ordutan, nonbaiten, zoro zoragarri 
batzuk euskararen alde /f^korrika dabiltzala :) http://t.co/X90EzXoq8p 

@maia_jon 

(132) 

Korrika edo Giza katea bezalako ekimenek sortzen duten energia 

kolektiboa ez al dira nahikoa froga herri honen bidea zein den ohartzeko? 

@korrika_aek (126) 

Hasi da korrikal9 I! Tipi tapa tipi tapa KORRIKAI! 

@Hostinet 

(98) 

Unete a la ^Korrika y contrata tu ^dominio .eus y /f^hosting web por 
tan solo 29,95 € con @Hostinet y @puntueus https://t.co/RTxoGkyKOn 

@garesko_auzalan (96) 

Korrikaren gazte kilometroa Garesen! http://t.co/HHPjaVPqJ8 

@Lupilakasta (91) 

Fiterotik Bilbora abia dadin Korrika!! http://t.co/w4esPCX3Xw 

@EuskalakariAEK 

(89) 

2.500 km egin ostean, lekukoa Bilbora iritsi da. Hona hemen mezua! 

Gora #korrika! Eskerrik asko, @katuajea! http://t.co/yB5ClFcWk4 


1. taula. Txio bertxiotuenak, bertxio kopuruaren arabera ordenatuta. 


Zoritxarrez, txio guztiek ez dute eskuragarri geokokapena, eta ezin da beti jakin txio bat 
nondik bidali den. Hori dela eta, geokokapena eskaintzen duten txioetara mugatu behar du- 
gu ondoko analisia. Txioetatik geokokapena dutenak erauzteko, coordinates.py programa 
erabiltzen dugu, behean azaldutako komandoaren bitartez, eta ondoren CartoDB^^ doako 
zerbitzua erabiliz bistaratu. CartoDB zerbitzuan erregistratu beharra dago, baina guztiz 
doakoa da, eta nahikoa da coordinates.py programak sortzen duen koordenatu-zerrenda 
igotzearekin. 

python coordinates.py korrika.json korrika-koordenatuak.dat 

Txio geokokatuekin sortutako mapa 2. irudiak erakusten du. Mapa horrek erakusten 
duenez, txioak Euskal Herri osoan zehar zabaldu ziren, lurralde guztietan. Hiriburuetan 
eta inguruetan txio gehiago dauden arren, Arrasate, Durango, Gernika, Tolosa, Altsasu, 
Lizarra, Tafalla eta beste herri askotatik ere hainbat txio bidali ziren. 

4.2. Erabiltzaileen analisia 

Edukia aztertu ondoren, sare sozialetan garrantzi handikoa den beste faktore bat az- 
tertzeari ekingo diogu; erabiltzaileak, alegia. Aktiboenen zerrenda sortuz hasiko dugu 
erabiltzaileen analisia; nork bidali zituen txio gehien Korrikaren gainean? Horretarako, 

^^http://www. cartodb.com/ 
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2. irudia. Txio geokokatuen mapa. 


top-tvoeets.py programa erabil dezakegu, komando honen bitartez: 


python top-tweets.py -v users -f korrika.json -k 10 


Erabiltzailea 

Txio kopurua 

@idorrokia 

1085 

@EuskalakariAEK 

910 

@korrika_aek 

614 

@HamaikaTb 

444 

@EAPortugalete 

239 

@naiz_info 

233 

@gaztea 

227 

@berria 

216 

@euskalirratiak 

208 

@anabarri72 

204 


2. taula. Erabiltzaile aktiboenak. 


Korrikan zehar txio gehien bidali zituzten 10 erabiltzaileak 2. taulak erakusten dira. 
Zerrenda honetan, Korrikarekin lotutako kontuak (@EuskalakariAEK eta @korrika_aek) 
eta komunikabideak (@HamaikaTb, @naiz_info, @gaztea, @berria, @euskahrratiak) dira 
nagusi, baina badaude erabiltzaile arrunten (@idorrokia, @anabarri72) eta alderdi poli- 
tikoen (@EAPortugalete) kontuak ere tartean. Dena den, zerrenda honek txio kopurua 
baino ez du erakusten, eta sakonago aztertu nahiko genuke nor izan diren interesgarrienak 
komunitatearentzat. Hori neurtzeko, bertxio kopuruari erreparatuko diogu. Zein erabil- 
tzailek jaso zuten bertxio gehien? top-users.py programa erabiliz, zerrenda hau eskura 
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dezakegu; 


python top-users.py korrika.json 


Erabiltzailea 

Bertxio kopurua 

@EuskalakariAEK 

1642 

@naizJnfo 

918 

@HamaikaTb 

720 

@hirual 

640 

@korrika_aek 

568 

@argia 

482 

@berria 

385 

@larbelaitz 

363 

@gaztea 

305 

@MeriLingl 

243 


3. taula. Erabiltzaile bertxiotuenak. 


Hain zuzen, 3. taulak erakusten du bertxio gehien jaso zituzten 10 erabiltzaileen ze- 
rrenda. Lehenago azaldutako erabiltzaile aktiboenekin alderatuta, badaude hor goian man- 
tendu diren batzuk, baina beste batzuk aldatu egin dira. Korrikarekin lotutako kontuak 
hor goian daude oraindik (@EuskalakariAEK, @korrika_aek), eta baita aurretik genituen 
hainbat komunikabide ere (@naiz_info, @HamaikaTb, @berria, @gaztea); baina oraingoan 
beste komunikabide bat ere agertu zaigu tartean (@argia), hainbeste txiokatu gabe ber- 
txio kopuru handia lortu duena. Oraingoan, baina, erabiltzaile arruntak desagertu egin dira 
zerrendatik, eta hainbat kazetarik hartu dute haien lekua (@hirual, @larbelaitz, @Meri- 
Lingl). Horren arabera, badirudi kazetariek gutxiagotan txiokatu dutela, baina interes 
handiagoa piztuz. 

Erabiltzaileen analisi honetan sakondu eta grafikoki ikusi ahal izateko, erabiltzaile 
nagusien sare soziala bistaratu nahi dugu, amaitzeko. Horretarako, erabiltzaileen arteko 
interakzioak erauziko ditugu lehenengo. Hau da, noren txioak bertxiotu edo erantzun 
ditu erabiltzaile bakoitzak? Horretarako, @a erabiltzaileak @b erabiltzailearen txio bat 
bertxiotzen badu, interakzio moduan hartuko dugu kontuan. Era berean, @a erabiltzaileak 
@b-ren txio bati erantzuten badio. Korrikako txio guztietatik interakzio horien zerrenda 
erauzteko, interactions.py erabiliko dugu, honako komandoarekin: 

python interactions.py korrika.json korrika-interakzioak.csv 

Ondoren, interakzioen fitxategi hau bistaratzeko Gephi^® beharko dugu. Gephi software 
librea da eta plataforma ezberdinetarako (Windows, Linux, Mac) dago eskuragarri. Sortu 
^®http: / / gephi.github.io/ 
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3. irudia. Erabiltzaile esanguratsuenekin osatutako grafoa. 
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berri dugun korrika-interakzioak. csv fitxategia Gephi-n kargatu dezakegu orain, eta sare 
soziala bistaratu. 

Emaitza 3. irudian ikus daiteke. Erabiltzaile nabarmenenak bistaratzen dira bertan, 
eta beraien arteko loturaren sendotasunak interakzio kopurua adierazten du; koloreek, 
berriz, komunitateak. Grafo honek @EuskalakariAEK kontu ofizialaren garrantzia nabar- 
mentzen du, Korrikaren sareko presentzia eta informazioaren zabalpenerako ezinbestekoa 
izan zena. Etorkizunean ospatuko diren ekitaldientzako lezioa ere ematen digu honek, kon- 
tu ofizial bat edukitzea zenbateraino den garrantzitsua erakusten baitu. Kontu ofizialaz 
gain, irudiak erakusten digu inguruko erabiltzaileak gehienbat kazetariak eta komunika- 
bideak direla. Datu horrek kazetari eta komunikabideen garrantzia erakusten du, ekital- 
diaren ikusgarritasuna areagotu eta informazioa zabaltzeko lanetan. Horiez gain, beste 
erabiltzaile mota batzuen garrantzia ere ikus dezakegu, tartean futbol taldeak (@sdeibar, 
@AthleticClub), musikariak (@ZuriHesian) eta alderdi politikoak (@ehbildu). 

5. Ondorioak 

Artikulu honetan Twitter sare sozialean mundu errealeko ekitaldi batek utzitako isla 
ikertzeko metodologia definitu, azaldu eta praktikan jarri dugu, 2015eko Korrika aztertuz. 
Orain arte ez dugu antzeko analisirik ikusi euskaraz; hori dela eta, ezinbestekoa iruditzen 
zaigu, sare sozialen analisiak beste hizkuntza batzuetan bereganatu duen garrantzia eus- 
karara hurbiltzeko. Analisia egiteko tresna guztiak eskuragarri daude sarean, nahi duenak 
ekitaldi gehiago ikertu ahal izan ditzan eta ikerketa-arlo honetan sakontzeko. 

Korrikaren analisia bi zatitan banatu dugu: edukiaren analisia eta erabiltzaileen ana- 
lisia. Biek ere aurkikuntza interesgarriak egiteko aukera eskaini digute. Edukiari dago- 
kionez, txio kopuruak jasaten dituen gora-beherak azaldu ditugu, non une garrantzitsue- 
nak txio kopuruan islatzen diren, txio gehiago sortuz (kasu honetan, ekitaldiaren hasiera 
eta amaierako momentuak). Erabiltzaileei dagokienez, ordea, ekitaldiaren zabalkunderako 
kontu ofiziala izatearen garrantzia nabarmendu dugu. Kontu ofizialaz gain, kazetariak eta 
komunikabideak ezinbestekoak dira ikusgarritasuna areagotu eta informazioa komunita- 
tean zabaldu ahal izateko. Horiek guztiak kontuan izatea oso garrantzitsua da ekitaldi bat 
Twitter sare sozialean ikusgarri egin eta erabiltzaileen parte-hartzea sustatzeko. 

Korrikaren kasu konkretua azalduz, euskal komunitatea ulertzeaz gain, sare sozialak 
ikertzeko metodologia eta tresnak elkarbanatuz euskararen inguruko analisi gehiago sus- 
tatzea izan da lan honen motibazio eta helburu nagusia. 

6. Etorkizunerako erronkak 

Hemen aurkeztutako analisia hastapenekoa baino ez da, eta etorkizunean antzeko anali- 
si gehiago egin ahal izatea da orain erronka nagusia. Etorkizunean euskal ikerlariek antzeko 
ikerketa-lanak gehiago lantzea eta analisi gehigarriak eginez euskarazko eta Euskal Herriko 
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gertakizun eta ekitaldiek sare sozialetan sortzen duten islaren gainean gehiago jakitea da 
helburua. 

Metodologia zehaztu eta tresnak liberatzeaz gain, euskarazko ekitaldien sare soziale- 
tako isla aztertu eta ulertzeko lan asko dago aurretik oraindik ere. Alde batetik, euskara- 
ren inguruko ikerketa-lan gehiago burutzea, eta bestalde, sare sozialek aurkezten dituzten 
erronkak, lan honetan laburbildu ditugunak, gainditu eta horrelako ikerketa-lanak are 
gehiago sendotzea. Twitterrek ez duenez ematen batutako txio guztien artean euskarazko 
txioak zein diren jakiteko aukera, hizkuntza-identifikazio hori egin dezakeen tresna lantzea 
da etorkizunerako ezinbesteko beharretako bat. Aurretik, horrelako tresna bat lantzeko 
asmoz, tartean Euskal Herriko Unibertsitatearekin eta Elhuyarrekin landutako TweetLID 
atazan [13] egin genituen lehen saiakerak, eta anotatutako datu-bilduma eskaini genuen, 
ikertzaileek euskarazko txioen identifikazioa gehiago landu zezaten. 
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